한글 음절

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요
2. 현대 한글의 음절
3. 옛 한글 음절
4. 한글 음절 유니코드
5. 현대 한글 음절 목록
6. 유니코드의 한글 음절 인코딩 역사
7. 유니코드 관련 문서
참조

1. 개요

한글 음절은 현대 한글에서 11,172자를 표현할 수 있으며, 초성, 중성, 종성의 조합으로 구성된다. 옛 한글 음절은 유니코드에서 자모의 조합으로 나타나며, 유니코드 2.0 이후의 한글 음절 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)" 형식을 따른다. 유니코드에서 한글 음절 인코딩은 여러 단계를 거쳐 발전해 왔으며, 초기에는 KS X 1001에 있는 2,350자만 포함되었으나, 이후 확장을 통해 현재의 11,172자를 지원하게 되었다.

더 읽어볼만한 페이지

한글 - 한글날
한글날은 훈민정음 반포를 기념하는 날로, 대한민국에서는 매년 10월 9일에 기념하며 한글의 독창성과 과학성을 알리고 한글 사랑 의식을 높이기 위한 다양한 기념행사가 열린다.
한글 - 조선어학회 사건
조선어학회 사건은 일제강점기, 일제가 조선어 말살 정책의 일환으로 조선어학회 회원들을 체포하고 탄압한 사건으로, 이윤재, 최현배 등이 고문과 옥사를 당했으며, 한국어 사전 편찬에 차질을 빚었으나 광복 후 『조선어대사전』 편찬으로 이어져 한국어 발전과 민족 문화 수호의 중요성을 보여주는 사례로 평가받는다.

2. 현대 한글의 음절

현대 한글에서 표현할 수 있는 글자는 총 11,172자이다. 현대 한글에서 사용되는 낱자는 다음과 같다.

초성: ㄱㄲㄴㄷㄸㄹㅁㅂㅃㅅㅆㅇㅈㅉㅊㅋㅌㅍㅎ (19개)
중성: ㅏㅐㅑㅒㅓㅔㅕㅖㅗㅘㅙㅚㅛㅜㅝㅞㅟㅠㅡㅢㅣ (21개)
종성: ㄱㄲㄳㄴㄵㄶㄷㄹㄺㄻㄼㄽㄾㄿㅀㅁㅂㅄㅅㅆㅇㅈㅊㅋㅌㅍㅎ (27개) - 종성이 없는 경우도 있음

위의 초성, 중성, 종성을 조합해서 만들 수 있는 글자 수는 다음과 같다.

19 × 21 × (27 + 1) = 11172

이 글자들은 한글 조합형 인코딩에서는 모두 표현할 수 있으나 KS X 1001 한글 완성형 인코딩에는 자주 쓰는 2,350글자만 포함되어 있어 나머지 8,822글자는 표현할 수 없으므로 고유 명사를 표기할 때 문제가 발생하였다. 최근에 사용되는 확장 완성형 코드나 유니코드 계열에서는 11,172글자를 모두 지원하고 있다. 실제로 발음되지 못하거나 한국어에 나타나지 않는 예를 빼면 전부는 6300 미만 정도가 된다.

3. 옛 한글 음절

옛 한글 음절은 KS X 1002나 GB 12052(중국어)에만 한 글자로 등록되어 있으며, 유니코드에서는 자모를 조합하여 나타낸다. 유니코드에서 나타낼 수 있는 모든 한글 음절의 수는 다음과 같다.

초성: U+1100~U+115E의 95개 + U+A960~U+A97C의 29개 + U+115F의 채움 문자 1개, 총 125개
중성: U+1161~U+11A7의 71개 + U+D7B0~U+D7C6의 23개 + U+1160의 채움 문자 1개, 총 95개
종성: U+11A8~U+11FF의 88개 + U+D7CB~U+D7FB의 49개, 총 137개 (종성이 없는 경우도 포함)

이러한 초성, 중성, 종성을 조합하여 만들 수 있는 글자 수는 125 × 95 × (137 + 1) = 1,638,750이다. KS X 1026-1이 허용하지 않는 초성(채움 문자 제외)과 종성만의 조합(중성에는 채움 문자 사용)의 개수는 124 × 137 = 16,988자이며, 사실상 빈 문자인 초성 채움 문자와 중성 채움 문자의 조합 한 자 또한 있으므로 이 16,989자를 제외하면 1,621,761자가 된다.^[8] 이 1,621,761 자 중, 한글 낱자를 표현하는 것은 124 + 94 + 137 = 355 자이다.

한글 자모의 초성 자리에 쓰이는 닿소리 글자는 ㄱ(g), ㄲ(kk), ㄴ(n), ㄷ(d), ㄸ(tt), ㄹ(r), ㅁ(m), ㅂ(b), ㅃ(pp), ㅅ(s), ㅆ(ss), ㅇ(ng), ㅈ(j), ㅉ(jj), ㅊ(ch), ㅋ(k), ㅌ(t), ㅍ(p), ㅎ(h) 등이 있다.

한글의 중성은 로마자로 표기할 때 ㅏ는 a, ㅐ는 ae, ㅑ는 ya, ㅒ는 yae, ㅓ는 eo, ㅔ는 e, ㅕ는 yeo, ㅖ는 ye, ㅗ는 o, ㅘ는 wa, ㅙ는 wae, ㅚ는 oe, ㅛ는 yo, ㅜ는 u, ㅝ는 wo, ㅞ는 we, ㅟ는 wi, ㅠ는 yu, ㅡ는 eu, ㅢ는 ui, ㅣ는 i로 표기한다.

한글 음절의 종성(終聲)은 자음으로, 음절의 마지막에 오는 소리이다. 종성에는 ㄱ(g), ㄲ(kk), ㄳ(gs), ㄴ(n), ㄵ(nj), ㄶ(nh), ㄷ(d), ㄹ(l), ㄺ(lg), ㄻ(lm), ㄼ(lb), ㄽ(ls), ㄾ(lt), ㄿ(lp), ㅀ(lh), ㅁ(m), ㅂ(b), ㅄ(bs), ㅅ(s), ㅆ(ss), ㅇ(ng), ㅈ(j), ㅊ(ch), ㅋ(k), ㅌ(t), ㅍ(p), ㅎ(h) 등의 자음이 올 수 있다. 예시로 밖(bak), 밖에(bakke), 안(an), 닫(dad), 달(dal), 암(am), 밥(bab), 솟(sos), 강(gang), 쿡(kuk), 툿(tut), 숲(sup), 닿(dah) 등을 들 수 있다.

4. 한글 음절 유니코드

초기 유니코드에는 KS X 1001에 있던 한글 음절 2,350자만이 포함되어 있었다.^[9] 이후 4,306자가 추가되어 유니코드 1.1에는 한글 음절이 6,656자 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.^[10]^[11] 1995년 대한민국의 제안으로 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11,172자가 가나다순으로 배열되었다.^[13]

유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이다.^[14]^[15] 예를 들어 은 과 같이 표현된다.
한글 음절 블록

유니코드에서 한글 음절을 인코딩하는 과정은 복잡했다. 초기 유니코드 1.0.0은 U+3400–U+3D2D 범위에 KS C 5601-1987의 현대 한국어 한글 음절 2,350자를 인코딩했다. 이후 버전 1.1에서 1,930개의 추가 현대 음절을 U+3D2E–U+44B7에, GB 12052-89에서 6개의 현대 음절을 U+44B8–U+44BD에, U+44BE–U+4DFF에 위에 언급된 세 가지 집합에 없는 처음 2,370개의 음절을 추가했다.

유니코드 1.1에는 세 가지 오류가 있었다.^[3] U+384E는 유니코드 문자 데이터베이스에서는 삤이지만, 유니코드 1.0 및 ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 삣이다. U+40BC는 유니코드 문자 데이터베이스에서는 삣이지만, ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 삤이다. U+436C는 유니코드 문자 데이터베이스에서는 콫이지만, ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 콪이다.

버전 2.0에서는 KS C 5601-1992에서 나머지 4,516개의 가능한 음절을 추가하고 모든 인코딩된 음절을 현재의 U+AC00–U+D7AF 범위로 재정렬하여 알고리즘 방식으로 개별 자모로 분해할 수 있게 했다.^[4]^[5]

에서는 이처럼 호환되지 않는 중요한 변경이 한국어에 유니코드를 사용하는 데이터나 소프트웨어가 존재하지 않는다는 가정하에 이루어졌다고 설명한다.

}}

이후, 유니코드는 "문자가 인코딩되면 이동하거나 제거되지 않습니다"라고 명시하는 인코딩 안정성 정책을 채택했다.^[6]

다음은 한글 음절 블록에서 특정 문자를 정의하는 목적과 과정을 기록한 유니코드 관련 문서이다.

=== 한글 음절 표기 (로마자) ===

한글 음절은 초성, 중성, 종성의 조합으로 이루어져 있으며, 각 구성 요소는 특정한 로마자로 표기된다.

==== 중성 ====

한글의 중성은 다음과 같이 로마자로 표기한다.

ㅏ: a
ㅐ: ae
ㅑ: ya
ㅒ: yae
ㅓ: eo
ㅔ: e
ㅕ: yeo
ㅖ: ye
ㅗ: o
ㅘ: wa
ㅙ: wae
ㅚ: oe
ㅛ: yo
ㅜ: u
ㅝ: wo
ㅞ: we
ㅟ: wi
ㅠ: yu
ㅡ: eu
ㅢ: ui
ㅣ: i

==== 종성 ====

한글 음절의 종성은 음절의 마지막에 오는 소리로, 자음으로 구성된다. 종성은 다음과 같은 자음으로 표기한다.

ㄱ: g (예: 밖(bak))
ㄲ: kk (예: 밖에(bakke))
ㄳ: gs
ㄴ: n (예: 안(an))
ㄵ: nj
ㄶ: nh
ㄷ: d (예: 닫(dad))
ㄹ: l (예: 달(dal))
ㄺ: lg
ㄻ: lm
ㄼ: lb
ㄽ: ls
ㄾ: lt
ㄿ: lp
ㅀ: lh
ㅁ: m (예: 암(am))
ㅂ: b (예: 밥(bab))
ㅄ: bs
ㅅ: s (예: 솟(sos))
ㅆ: ss
ㅇ: ng (예: 강(gang))
ㅈ: j
ㅊ: ch
ㅋ: k (예: 쿡(kuk))
ㅌ: t (예: 툿(tut))
ㅍ: p (예: 숲(sup))
ㅎ: h (예: 닿(dah))

4. 1. 초성

한글 자모의 초성 자리에 쓰이는 닿소리 글자는 다음과 같다. ㄱ(g), ㄲ(kk), ㄴ(n), ㄷ(d), ㄸ(tt), ㄹ(r), ㅁ(m), ㅂ(b), ㅃ(pp), ㅅ(s), ㅆ(ss), ㅇ(ng), ㅈ(j), ㅉ(jj), ㅊ(ch), ㅋ(k), ㅌ(t), ㅍ(p), ㅎ(h)

4. 2. 중성

한글의 중성은 다음과 같이 로마자로 표기한다.

ㅏ는 a로 표기한다.
ㅐ는 ae로 표기한다.
ㅑ는 ya로 표기한다.
ㅒ는 yae로 표기한다.
ㅓ는 eo로 표기한다.
ㅔ는 e로 표기한다.
ㅕ는 yeo로 표기한다.
ㅖ는 ye로 표기한다.
ㅗ는 o로 표기한다.
ㅘ는 wa로 표기한다.
ㅙ는 wae로 표기한다.
ㅚ는 oe로 표기한다.
ㅛ는 yo로 표기한다.
ㅜ는 u로 표기한다.
ㅝ는 wo로 표기한다.
ㅞ는 we로 표기한다.
ㅟ는 wi로 표기한다.
ㅠ는 yu로 표기한다.
ㅡ는 eu로 표기한다.
ㅢ는 ui로 표기한다.
ㅣ는 i로 표기한다.

4. 3. 종성

한글 음절의 종성(終聲)은 자음으로, 음절의 마지막에 오는 소리이다. 종성에는 다음과 같은 자음들이 올 수 있으며, 각각에 대한 로마자 표기 규칙은 다음과 같다.

ㄱ: g로 표기한다. 예) 밖(bak)
ㄲ: kk로 표기한다. 예) 밖에(bakke)
ㄳ: gs로 표기한다.
ㄴ: n으로 표기한다. 예) 안(an)
ㄵ: nj로 표기한다.
ㄶ: nh로 표기한다.
ㄷ: d로 표기한다. 예) 닫(dad)
ㄹ: l로 표기한다. 예) 달(dal)
ㄺ: lg로 표기한다.
ㄻ: lm으로 표기한다.
ㄼ: lb로 표기한다.
ㄽ: ls로 표기한다.
ㄾ: lt로 표기한다.
ㄿ: lp로 표기한다.
ㅀ: lh로 표기한다.
ㅁ: m으로 표기한다. 예) 암(am)
ㅂ: b로 표기한다. 예) 밥(bab)
ㅄ: bs로 표기한다.
ㅅ: s로 표기한다. 예) 솟(sos)
ㅆ: ss로 표기한다.
ㅇ: ng로 표기한다. 예) 강(gang)
ㅈ: j로 표기한다.
ㅊ: ch로 표기한다.
ㅋ: k로 표기한다. 예) 쿡(kuk)
ㅌ: t로 표기한다. 예) 툿(tut)
ㅍ: p로 표기한다. 예) 숲(sup)
ㅎ: h로 표기한다. 예) 닿(dah)

5. 현대 한글 음절 목록

현대 한글 음절 목록은 유니코드에 포함되어 있으며, 총 11,172글자가 있다. 이 글자들은 U+AC00부터 U+D7A3까지 연속적으로 배열되어 있다.^[13] 유니코드 컨소시엄은 공식 코드 차트를 PDF 형태로 제공한다.

6. 유니코드의 한글 음절 인코딩 역사

유니코드에서 한글 음절을 인코딩하는 과정은 복잡한 변화를 거쳐왔다. 초기 유니코드에는 KS X 1001에 정의된 한글 음절 2350자만이 포함되어 있었다.^[9]

이후 4306자가 추가되어 유니코드 1.1에는 총 6656자의 한글 음절이 존재했지만, 당시 U+3400~U+4DFF 영역 뒤에 바로 한중일 통합 한자가 이어져 있어 추가적인 확장이 어려웠다.^[10]^[11]

1995년, 대한민국은 유니코드에 한글 음절 영역을 U+AC00~U+D7A3으로 재배정하고, 11172자를 가나다순으로 배열할 것을 제안했다.^[12]^[13]

유니코드 버전별 변화는 다음과 같다.

유니코드 1.0.0: U+3400–U+3D2D 영역에 KS C 5601-1987 기반의 현대 한글 음절 2,350자를 인코딩했다. 이 영역은 현재 CJK 통합 표의 문자 확장 A에 포함된다.
유니코드 1.1: KS C 5657-1991의 1,930자를 U+3D2E–U+44B7에, GB 12052-89의 6자를 U+44B8–U+44BD에 추가했다. 또한 U+44BE–U+4DFF에는 앞선 세 집합에 없는 2,370자를 추가했다. 이들은 현재 CJK 통합 표의 문자 확장 A의 나머지 부분과 역경 괘 상징 전체를 포함한다. 유니코드 1.1에는 다음과 같은 오류도 있었다.^[3]
* U+384E: 데이터베이스상으로는 '삤'이지만, 유니코드 1.0 및 ISO/IEC 10646-1:1993 코드 차트에는 '삣'으로 되어 있다.
* U+40BC: 데이터베이스상으로는 '삣'이지만, ISO/IEC 10646-1:1993 코드 차트에는 '삤'으로 되어 있다.
* U+436C: 데이터베이스상으로는 '콫'이지만, ISO/IEC 10646-1:1993 코드 차트에는 '콪'으로 되어 있다.
유니코드 2.0: KS X 1001의 나머지 4,516자를 추가하고, 모든 음절을 U+AC00–U+D7AF 영역으로 재정렬하여 알고리즘 방식으로 자모를 분해할 수 있도록 했다.^[4]^[5]

IETF RFC 2279에 따르면, 이러한 변경은 당시 한국어 유니코드 사용자나 소프트웨어가 없다는 가정하에 이루어졌다. 하지만 이러한 가정은 논란의 여지가 있었으며, 이후 유니코드는 인코딩 안정성 정책을 채택하여 "문자가 인코딩되면 이동하거나 제거되지 않는다"는 원칙을 확립했다.^[6]

유니코드 2.0 이후 한글 음절 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)" 형식을 따른다.^[14]^[15] 각 부분에 대한 세부 규칙은 다음과 같다.

; 초성

; 중성

; 종성

예를 들어 퓛은 'Hangul Syllable PWILH'로 표현된다.

다음 표는 한글 음절 블록의 문자 정의 과정에 대한 유니코드 관련 문서 목록이다.

버전

최종 코드 포인트

개수

UTC ID

L2 ID

WG2 ID

문서

2.0

U+AC00..D7A3

11,172

[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n0767.doc N0767]

1991년 10월 WG2-파리 회의 비확정 의사록

X3L2/93-078

N848

수정된 한국어 위치

https://www.unicode.org/L2/L1994-UTC/Discussion-on-Korean.TXT UTC/1994-xxx

유니코드 기술 위원회 회의 #62: 한국어 한글 제안에 대한 토론

X3L2/95-031

N1158

한글 문자를 추가하기 위한 한국 국가 입장

N1170

한글 문자를 추가하기 위한 N 1158의 한국어 제안에 대한 캐나다 입장

https://www.unicode.org/L2/L1995-UTC/UTC64-Closed-Caucus-Minutes.txt UTC/1995-021B

비공개 코커스 회의록, UTC #64

N1198

한글에 대한 pDAM을 10646에 대한 작업 초안

X3L2/95-053.1

N1199

한국어 코딩 배경

https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1203.txt N1203

SC2/WG2 회의 27, 제네바의 비확정 의사록

X3L2/95-053

N1209

ISO/IEC 10646-1에 대한 PDAM 5: 한글 문자 집합

https://www.unicode.org/L2/L1995-UTC/UTC65-Minutes.TXT UTC/1995-xxx

유니코드 기술 위원회 회의 #65, 의사록

X3L2/95-090

6. 1. 유니코드 버전 1.0.0

초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.^[9]

유니코드 버전 1.0.0은 U+3400–U+3D2D 범위에서 KS C 5601-1987의 현대 한국어 한글 음절 2,350자를 인코딩했다. 이 범위는 현재 CJK 통합 표의 문자 확장 A의 일부이다.

6. 2. 유니코드 버전 1.1

초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.^[9] 이후에 4306자가 추가되어 유니코드 1.1에는 한글 음절가 6656자가 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.^[10]^[11]

유니코드 버전 1.0.0은 U+3400–U+3D2D에서 KS C 5601-1987의 현대 한국어 한글 음절 2,350자를 인코딩했다. 이 범위는 현재 CJK 통합 표의 문자 확장 A의 일부이다. 버전 1.1에서는 KS C 5657-1991에서 1,930개의 추가 현대 음절을 U+3D2E–U+44B7에, GB 12052-89에서 6개의 현대 음절을 U+44B8–U+44BD에 추가했다. U+44BE–U+4DFF에는 위에 언급된 세 가지 집합에 없는 처음 2,370개의 음절을 추가했다. 이것들은 집합적으로 현재 CJK 통합 표의 문자 확장 A의 나머지 부분과 현재 역경 괘 상징의 전부를 포함한다.

6. 2. 1. 유니코드 1.1의 오류

초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.^[9] 이후에 4306자가 추가되어 유니코드 1.1에는 한글 음절가 6656자가 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.^[10]^[11] 이후, 1995년에 대한민국의 제안으로^[12] 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11172자가 가나다순으로 배열되었다.^[13]

유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이고, 초성, 중성, 종성의 세부적인 규칙은 아래와 같다.^[14]^[15]

초성

중성

종성

이 규칙에 따르면, U+D4DB은 Hangul Syllable PWILH과 같이 표현된다.

6. 3. 유니코드 버전 2.0

초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.^[9] 이후에 4306자가 추가되어 유니코드 1.1에는 한글 음절가 6656자가 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.^[10]^[11] 이후, 1995년에 대한민국의 제안으로^[12] 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11172자가 가나다순으로 배열되었다.^[13]

유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이고, 초성, 중성, 종성의 세부적인 규칙은 아래와 같다.^[14]^[15]

이 규칙에 따르면, 퓛은 Hangul Syllable PWILH과 같이 표현된다.

유니코드에서 한글 음절을 인코딩하는 것은 코드 포인트의 재구성에 의해 복잡해졌다.

유니코드 버전 1.0.0은 U+3400–U+3D2D에서 KS C 5601-1987의 현대 한국어 한글 음절 2,350자를 인코딩했다. 이 범위는 현재 CJK 통합 표의 문자 확장 A의 일부이다.
버전 1.1에서는 KS C 5657-1991에서 1,930개의 추가 현대 음절을 U+3D2E–U+44B7에, GB 12052-89에서 6개의 현대 음절을 U+44B8–U+44BD에, U+44BE–U+4DFF에 위에 언급된 세 가지 집합에 없는 처음 2,370개의 음절을 추가했다. 이것들은 집합적으로 현재 CJK 통합 표의 문자 확장 A의 나머지 부분과 현재 역경 괘 상징의 전부를 포함한다.
또한, 유니코드 1.1에는 세 가지 오류가 있었다.^[3]
* U+384E: 유니코드 문자 데이터베이스에서는 삤이지만, 유니코드 1.0 및 ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 삣이다.
* U+40BC: 유니코드 문자 데이터베이스에서는 삣이지만, ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 삤이다.
* U+436C: 유니코드 문자 데이터베이스에서는 콫이지만, ISO/IEC 10646-1:1993 코드 차트 및 소스 표준 매핑에 따르면 콪이다.
버전 2.0에서는 KS C 5601-1992에서 나머지 4,516개의 가능한 음절을 추가하고^[4]^[5] 모든 인코딩된 음절을 현재의 U+AC00–U+D7AF 범위로 재정렬하여 알고리즘 방식으로 개별 자모로 분해할 수 있게 했다.

IETF RFC 2279에서는 이처럼 호환되지 않는 중요한 변경이 한국어에 유니코드를 사용하는 데이터나 소프트웨어가 존재하지 않는다는 가정하에 이루어졌다고 설명한다.

그러한 호환되지 않는 변경을 허용한 공식적인 정당성은 한글을 포함하는 구현과 데이터가 존재하지 않는다는 것이었는데, 이는 사실일 가능성이 높지만 입증할 수 없는 진술입니다. 이 사건은 "한국어 혼란"이라고 불리며, 관련 위원회는 다시는 그러한 호환되지 않는 변경을 절대 하지 않겠다고 약속했습니다. — IETF RFC 2279

이후, 유니코드는 "문자가 인코딩되면 이동하거나 제거되지 않습니다"라고 명시하는 인코딩 안정성 정책을 채택했다.^[6]

다음은 한글 음절 블록에서 특정 문자를 정의하는 목적과 과정을 기록한 유니코드 관련 문서이다.

버전

최종 코드 포인트

개수

UTC ID

L2 ID

WG2 ID

문서

2.0

U+AC00..D7A3

11,172

https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n0767.doc N767

1991년 10월 WG2-파리 회의 비확정 의사록

X3L2/93-078

N848

수정된 한국어 위치

https://www.unicode.org/L2/L1994-UTC/Discussion-on-Korean.TXT UTC/1994-xxx

유니코드 기술 위원회 회의 #62: 한국어 한글 제안에 대한 토론

X3L2/95-031

N1158

한글 문자를 추가하기 위한 한국 국가 입장

N1170

한글 문자를 추가하기 위한 N 1158의 한국어 제안에 대한 캐나다 입장

https://www.unicode.org/L2/L1995-UTC/UTC64-Closed-Caucus-Minutes.txt UTC/1995-021B

비공개 코커스 회의록, UTC #64

N1198

한글에 대한 pDAM을 10646에 대한 작업 초안

X3L2/95-053.1

N1199

한국어 코딩 배경

https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1203.txt N1203

SC2/WG2 회의 27, 제네바의 비확정 의사록

X3L2/95-053

N1209

ISO/IEC 10646-1에 대한 PDAM 5: 한글 문자 집합

https://www.unicode.org/L2/L1995-UTC/UTC65-Minutes.TXT UTC/1995-xxx

유니코드 기술 위원회 회의 #65, 의사록

X3L2/95-090

6. 4. 인코딩 안정성 정책

유니코드는 "문자가 인코딩되면 이동하거나 제거되지 않습니다"라고 명시하는 인코딩 안정성 정책을 채택했다.

초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.^[9] 이후 4306자가 추가되어 유니코드 1.1에는 한글 음절이 6656자였지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한중일 통합 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.^[10]^[11] 이후, 1995년에 대한민국의 제안으로^[12] 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11172자가 가나다순으로 배열되었다.^[13]

유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이고, 초성, 중성, 종성의 세부적인 규칙은 아래와 같다.^[14]^[15]

; 초성

; 중성

; 종성

이 규칙에 따르면, 퓛은 Hangul Syllable PWILH과 같이 표현된다.

7. 유니코드 관련 문서

초기 유니코드에는 KS X 1001에 있던 한글 음절 2350자만이 포함되어 있었다.^[9] 이후에 4306자가 추가되어 유니코드 1.1에는 한글 음절가 6656자가 있었지만, 당시 한글 음절 영역인 U+3400~U+4DFF 뒤에는 곧바로 한자가 위치해 있어 나머지 한글 음절을 붙여 추가할 영역이 없었다.^[10]^[11] 이후, 1995년에 대한민국의 주도로^[12] 유니코드의 한글 음절 영역이 U+AC00~U+D7A3으로 새로 배정되고, 음절 11172자가 가나다순으로 배열되었다.^[13]

유니코드 2.0 이후의 한글 음절의 명명 규칙은 "HANGUL SYLLABLE (초성)(중성)(종성)"의 형식이고, 초성, 중성, 종성의 세부적인 규칙은 아래와 같다.^[14]^[15]

; 초성

; 중성

; 종성

이 규칙에 따르면, U+D4DB은 "Hangul Syllable PWILH"과 같이 표현된다.

참조

_[1] 웹사이트 Unicode character database https://www.unicode.[...] 2023-07-26
_[2] 웹사이트 Enumerated Versions of The Unicode Standard https://www.unicode.[...] 2023-07-26
_[3] 웹사이트 Informative document about three pre-Unicode-2.0 modern hangul syllables https://unicode.org/[...] 2017-03-29
_[4] 웹사이트 Korean Hangul Encoding Conversion Table https://unicode.org/[...] 1995-10-04
_[5] 웹사이트 Notes and corrections for HANGUL.TXT https://unicode.org/[...] 2005-10-13
_[6] 웹사이트 Unicode Character Encoding Stability Policies https://www.unicode.[...] Unicode Consortium 2016-11-14
_[7] 문서 KS X 1026-1에서 사용하는 용어
_[8] 문서 KS X 1026-1에서는 한글 낱자 또한 채움 문자를 넣어서 표현하도록 하고 있다.
_[9] 웹사이트 유니코드 1.0 데이터 http://www.unicode.o[...]
_[10] 웹사이트 유니코드 1.1 데이터 http://www.unicode.o[...]
_[11] 문서 유니코드 1.1에서, U+44BE에서 U+4DFF까지는 그 이전의 자리에 배정되지 않은 한글 '갃'에서 '뭝'까지만이 차례로 배정되었고, 그 이후 순서의 한글은 배정되지 않았다.
_[12] 뉴스 한글 완성형코드 국제표준 확정 http://newslibrary.n[...] 매일경제 1995-09-21
_[13] 웹사이트 유니코드 2.0 데이터 http://www.unicode.o[...]
_[14] 웹사이트 유니코드 데이터, Jamo.txt http://unicode.org/P[...]
_[15] 웹사이트 유니코드 표준 버전 7.0 설명서, 3장 12절 중 "Hangul Syllable Name Generation" http://www.unicode.o[...]

본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com

버전		개수	WG2 ID
2.0	U+AC00..D7A3	11,172	[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n0767.doc N767]
			N848

			N1158
			N1170

			N1198
			N1199
			[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1203.txt N1203]
			N1209

			[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1253.txt txt])
			N1285
			[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1303.doc doc])
			N1331
			N1332
			N1391
			[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1353.doc N1353]
			N1537
			N1561
			N1570
			[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n1603.doc N1603]
			[https://www.unicode.org/wg2/docs/n1806w97.doc doc])
			[https://www.unicode.org/wg2/docs/n1942w97.doc N1942]
			[https://www.unicode.org/wg2/docs/n1903.htm html], [https://www.unicode.org/wg2/docs/n1903w97.doc doc])
			[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n2018.pdf N2018]
			[https://www.unicode.org/wg2/docs/n2003.pdf N2003]
			[https://www.unicode.org/wg2/docs/n2119.htm N2119]
			[https://web.archive.org/web/20200215052615/http://std.dkuug.dk/jtc1/sc2/wg2/docs/n2120.pdf N2120]

			[https://www.unicode.org/wg2/docs/n2564.pdf N2564]



colspan="7" \|